我第一次看到這個詞彙,就是跟 Data Visualization(資料視覺化) 放在一起,看得眼花。所以花了時間把它搞清楚,頭就不昏了。也要注意別跟 (Server)Virtualization Software 混淆,這個領域是伺服器虛擬化。
本篇先擱置資料治理議題,後面會談。企業會因為各種原因資料散落在很多不同的系統,如果想要在數位轉型中實現資料驅動決策,就必須整合企業中不同系統的資料。為效能與成本考慮,就會出現是否移動資料(ETL/資料管線)的選擇。我們也可以用這個選擇來區分不同資料系統與資料架構:
因此,資料倉儲與資料湖泊必定需要考慮 ETL/資料管線,資料虛擬化工具則是以不開發 ETL/資料管線為前提的。
圖片來源:https://www.techtarget.com/searchitoperations/feature/5-leading-data-virtualization-tools-offer-integration-strategy
因為這種產品在台灣比較不普及,所以我們來探討資料虛擬化工具的功能。上述圖片來源網站的分析方式很好,我就使用它的結構分享我的觀察。
圖片來源:https://www.altexsoft.com/blog/data-virtualization/
資料虛擬化或許是在實踐資料治理時,資料整合策略的一種選擇,卻缺少資料目錄或資料品質這一類的功能。有部分原廠是因為本身就有資料整合產品,因此有資料品質功能,並非資料虛擬化工具應該有資料品質功能。這一段我們會在 Data Governance(資料治理)篇細說。
回到本質問題。
資料虛擬化是一種資料整合策略的選擇。
資料移動與不移動,需要考慮:
如果有個企業資料庫系統就是那兩種,資料應用場景也很單純,加上資料現有地系統的負載能力還很充裕。選擇資料虛擬化工具應該是高效益的。